Less
逐元素计算第一个输入 (Input0) 的元素是否小于第二个输入 (Input1) 的对应元素。该算子支持广播机制。
\[\begin{split}output_i = \begin{cases}
\text{True}, & \text{if } Input0_0 < Input1_i \text{ (Input0 is broadcasted)} \\
\text{True}, & \text{if } Input0_i < Input1_0 \text{ (Input1 is broadcasted)} \\
\text{True}, & \text{if } Input0_i < Input1_i \text{ (No broadcast)} \\
\text{False}, & \text{otherwise}
\end{cases}\end{split}\]
- 输入:
Input0 - 第一个输入数据地址。
Input1 - 第二个输入数据地址。
length - 计算的总长度。
optimize - 是否启用广播优化的标志。设置为1时启用。
in_elements_num0 - Input0 的元素个数。当 optimize 启用时,用于判断哪个输入是标量。
core_mask - 核掩码(仅共享存储版本需要)。
- 输出:
Output - 计算结果地址。
- 支持平台:
FT78NEMT7004
备注
FT78NE 支持int8, int16, int32, fp32, fp64
MT7004 支持fp16, fp32, int16, int32
共享存储版本:
-
void i8_less_s(int8_t *Input0, int8_t *Input1, bool *output, int length, int optimize, int in_elements_num0, int core_mask)
-
void i16_less_s(int16_t *Input0, int16_t *Input1, bool *output, int length, int optimize, int in_elements_num0, int core_mask)
-
void i32_less_s(int32_t *Input0, int32_t *Input1, bool *output, int length, int optimize, int in_elements_num0, int core_mask)
-
void hp_less_s(half *Input0, half *Input1, bool *output, int length, int optimize, int in_elements_num0, int core_mask)
-
void fp_less_s(float *Input0, float *Input1, bool *output, int length, int optimize, int in_elements_num0, int core_mask)
-
void dp_less_s(double *Input0, double *Input1, bool *output, int length, int optimize, int in_elements_num0, int core_mask)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <less.h> // 假设头文件名为 less.h
4int main(int argc, char* argv[]) {
5 float *input0 = (float *)0xA0000000; //input在DDR空间
6 float *input1 = (float *)0xB0000000;
7 bool *output = (bool *)0xC0000000;
8 int length = 1000;
9 int core_mask = 0xff;
10 // 不使用广播,optimize=0, in_elements_num0 无意义
11 fp_less_s(input0, input1, output, length, 0, length, core_mask);
12 return 0;
13}
私有存储版本:
-
void i8_less_p(int8_t *Input0, int8_t *Input1, bool *output, int length, int optimize, int in_elements_num0)
-
void i16_less_p(int16_t *Input0, int16_t *Input1, bool *output, int length, int optimize, int in_elements_num0)
-
void i32_less_p(int32_t *Input0, int32_t *Input1, bool *output, int length, int optimize, int in_elements_num0)
-
void hp_less_p(half *Input0, half *Input1, bool *output, int length, int optimize, int in_elements_num0)
-
void fp_less_p(float *Input0, float *Input1, bool *output, int length, int optimize, int in_elements_num0)
-
void dp_less_p(double *Input0, double *Input1, bool *output, int length, int optimize, int in_elements_num0)
C调用示例:
1//FT78NE示例
2#include <stdio.h>
3#include <less.h> // 假设头文件名为 less.h
4int main(int argc, char* argv[]) {
5 float *scalar_input = (float *)0x10000000; // 标量输入 (input0)
6 float *array_input = (float *)0x10001000; // 数组输入 (input1)
7 bool *output = (bool *)0x10002000;
8 int length = 1000; // 数组的长度
9 scalar_input = 5.0f; // 设置标量值
10 // 启用广播,比较一个标量和一个数组
11 fp_less_p(scalar_input, array_input, output, length, 1, 1);
12 return 0;
13}